#aproximación lineal

Aproximación por difusión para aprendizaje TD con ruido markoviano

Descubre cómo una nueva aproximación mediante ecuaciones diferenciales estocásticas revela el origen del error en el aprendizaje TD(0) con ruido markoviano.

2026-06-17 · 1 min

Convergencia en tiempo finito del Q-learning robusto distribucional

Descubre cómo el Q-learning robusto con aproximación lineal converge en tiempo finito bajo incertidumbre chi-cuadrado, usando solo trayectorias markovianas.

2026-06-16 · 1 min

Actualizaciones de objetivo duro promediadas geométricamente para Q-learning lineal

Descubre cómo el promedio geométrico de actualizaciones de objetivo duro estabiliza el Q-learning lineal. Un nuevo enfoque para mejorar el aprendizaje por refuerzo.

2026-06-10 · 2 min

Tasa robusta O(1/√T) para aprendizaje TD sin proyección

Descubre cómo el algoritmo TD(0) sin proyección logra una tasa de convergencia sublineal robusta, incluso con ruido markoviano. Una mejora clave para el RL.

2026-06-09 · 2 min

Actualizaciones de objetivo periódicas y suaves estabilizan el Q-learning lineal

Descubre cómo las actualizaciones periódicas y suaves de objetivo garantizan la convergencia del Q-learning lineal, según un riguroso análisis teórico.

2026-06-03 · 2 min